#optimización de cuantización

WUSH: Transformaciones Adaptativas Casi Óptimas para Cuantización de LLM

WUSH mejora la cuantización de LLMs hasta +2.8 puntos en W4A4. Transformaciones adaptativas casi óptimas para despliegue eficiente en GPU.

2026-06-02 · 1 min

Estimación de la escala de ventana máxima para el entrenamiento consciente de la cuantización casi sin pérdidas de HiF8 W8A8

Estimación de escala de ventana máxima para cuantización W8A8 casi sin pérdidas. Aprende a optimizar modelos reduciendo la degradación y mejorando la eficiencia.

2026-05-27 · 2 min